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摘要 :[ 目 的/ 意义] 探索 领 域 知识 发 展 过 程 中 的 聚 类 演化 问题 有 助 于 揭示 知识 聚 类 的 特征 和 规律 ,对 于 党 
握 知 识 生长 演进 过 程 中 关联 知识 的 聚集 具有 重要 意义 。[ 方 法 /过 程 ] 以 复杂 网 络 的 思想 为 基础 ,基于 标签 邻接 
关系 的 发 生 值 构建 时 间 序 列 领 域 知 识 网 络 。 即 依据 网 络 模 体 的 理论 ,采用 网 络 聚 类 系数 的 分 析 方 法 ,对 领域 知 


识 网 络 进行 动态 跟踪 与 分 析 ; 结 合 网 络 密 度 、 特 征 路 径 长 


度 、 节 点 度 值 . 封 闭 三 元 组 等 指标 ,从 随机 因素 、 度 相关 


性 、 邻 近 关 联 3 个 方面 对 领域 知识 发 展 过 程 中 的 聚 类 演化 现象 进行 分 析 。[ 结果 /结论 ] 研 究 结果 表明 :四 领域 
知识 在 发 展 进程 中 始终 保持 较 高 的 聚 类 性 ;加 领域 知识 的 聚 类 性 同时 包含 随机 性 与 结构 性 ( 非 随机 性 ) 两 方面 
BE; 加 领域 知识 聚 类 的 动态 状态 在 小 世界 网 络 和 无 标 度 网 络 之 间 据 摆 演 化 ;图 领域 知识 的 聚 类 状态 在 网 络 


做 入 和 局 部 节点 之 间 表 现 出 一 定 的 差异 性 。 
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知识 网 络 ”知识 聚 类 聚 类 系数 


长 期 以 来 ,领域 知识 的 群 聚 性 问题 一 直 是 图 书 情 
报 学界 努 力 探索 和 揭示 的 问题 。 众 多 研究 成 果 表 明 ， 
在 伟 何 学 科 领 域内 部 ,其 领域 内 的 知识 单元 都 不 是 以 
完 侈 抓 立 与 游离 的 状态 存在 ,而 是 基于 潜在 的 关联 关 
系 坚 现 出 一 定 的 团 簇 性 与 集群 性 。 这 种 知识 之 间 的 关 
联 锋 系 随 着 领域 知识 的 发 展 处 于 不 断 的 变化 中 ,从 而 
使 得 知识 的 聚 类 也 在 发 展 中 演化 变迁 。 一 方面 ,学 科 
领域 内 的 热点 知识 、 核 心 知 识 会 牵引 关联 知识 不 断 聚 
集 ; 另 一 方面 ,新 知识 的 孕育 和 产生 也 会 持续 踊 解 这 种 
聚集 状态 。 因 此 ,从 时 间 序 列 的 视角 对 领域 知识 聚 类 
问题 进行 动态 分 析 , 把握 和 揭示 领域 知识 发 展 过 程 中 
知识 聚 类 的 演化 特征 与 规律 ,成 为 知识 管理 领域 中 囊 
需 解决 的 问题 。 

有 鉴于 此 ,本 研究 以 复杂 网 络 理论 为 指导 ,基于 社 


发 展演 进 过 程 中 知识 网 络 的 聚 类 系数 进行 跟踪 与 分 
析 。 并 结合 知识 网 络 的 密度 、 特 征 路 径 长 度 、 节 点 度 
值 .封闭 三 元 组 .2 跳 路 径 等 指标 ,对 处 于 发 展 进程 中 
的 领域 知识 聚 类 问题 展开 研究 ,以 期 对 领域 知识 聚 类 
的 演化 状态 及 其 规律 做 出 有 益 的 探索 。 


2 研究 综述 


最 早 把 网 络 思维 引入 图 书 情报 学 研究 领域 的 当 
E. Garfield! 和 D. J. S. Price", — Afr 20 世纪 50、 
60 年 代 分 别 在 《科学 》( Science) 杂志 上 发 表 论 文 ,基于 
科学 论文 的 引用 关系 构建 引文 知识 网 络 ,从 网 络 思维 
的 视角 对 科学 知识 的 继承 与 发 扬 问题 展开 研究 。 随 着 
20 世纪 末 网 络 科 学 ( Network Science) 的 复兴 ,知识 
之 间 的 团 复 性 、 群 聚 性 问题 在 网 络 科 学 的 视角 下 得 以 
重新 诠释 。 知 识 节点 之 间 的 聚集 程度 使 知识 网 络 呈 现 


E 


会 化 标注 系统 的 当期 发 生 值 构建 时 间 序 列 领 域 知 识 网 
络 。 采 用 网 络 分 析 中 聚 类 系数 分 析 方 法 ,对 领域 知识 


复杂 的 拓扑 结构 ,国内 外 许多 学 者 开始 关注 基于 网 络 
分 析 的 领域 知识 聚 类 问题 。N.， Shibata 等 所 基于 SCI 
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和 SSCI 的 引用 数据 ,对 不 同类 型 的 引文 网 络 进行 对 比 
研究 ,发 现在 直接 引文 网 络 中 ,其 聚 类 系数 最 大 ,表明 
通过 直接 引用 连接 的 论文 内 容 相似 度 最 大 ,并 且 由 于 
核心 文献 包含 在 最 大 网 络 组 件 中 ,其 缺失 的 风险 最 小 。 
李 亚 婷 和 马 费 成 ”基于 Folksonomy 知识 组 织 模式 , 构 
建 社会 化 标签 共 现 网 络 ,通过 对 该 标签 网 络 的 计算 分 
析 , 发 现 标 签 知识 网 络 聚 类 系数 的 高 位 性 (C = 
0.816) 。 胡 昌平 和 陈 果 ” 则 将 以 三 元 闭 包 为 基础 的 聚 
类 结构 用 于 关键 词 知识 网 络 的 层次 结构 分 析 , 通 过 基 
于 聚 类 结构 的 子 层 融 合 和 大 层 区 分 ,分 析 关 键 词 知识 
网 络 中 节点 的 微观 关联 结构 ,发 现 基于 三 元 闭 包 的 睛 
类 结构 能 够 有 效 揭示 知识 网 络 微观 单元 的 多 样 性 。 
随 着 研究 工作 的 深入 ,近年 来 知识 网 络 的 相关 研 
digiti A BAA beh zh ds A rU. M. E. J. 
Nesünan " 根据 数据 库 中 的 书目 信息 ,对 物理 和 生物 领 
的 合作 网 络 的 时 间 演 变 进 行 了 实证 研究 。 研 究 中 
通 浏 前 后 时 间 窗 口 合作 网 络 的 对 比分 析 , 探 测 该 网 络 
是 员 何 发 生 改变 的 ,从 而 揭示 出 增长 网 络 中 的 聚 类 与 
ERER SER J. Makani 和 L. Spiteri ” 通 
PRE R0 ELI t PIREN K .标签 重用 以 及 标签 歧 
H3 A Erb UR, RA AREE HO R AE A B 
METH HET t 2b WA , sc ope ERU ENE H 
TEENI W. Liu 等 中 利用 美国 物理 学 会 的 
出 旺 物 数据 集 , 通 过 逐年 建立 书目 耦合 网 络 (BCN) , 识 
别 唾 代表 不 同 研究 领域 的 聚 类 ,以 冲积 图 的 形式 将 物 
理 研究 中 长 期 的 知识 演化 进行 可 视 化 呈现 ,探索 新 知 
识 是 如 何在 旧 知识 的 基础 之 上 建立 的 。 研 究 结果 表 
明 G 夫 多 领域 的 知识 取 类 都 经 历 了 较 弱 的 波 普 尔 混 合 ， 
很 少 有 领域 是 孤立 或 者 经 历 过 强烈 的 混合 。 刘 向 
等 "通过 引入 度 择优 连接 和 时 间 优先 连接 探测 科学 
知识 的 继承 与 更 新 过 程 。 其 中 度 择优 机 制 保证 了 对 重 
要 知识 的 连接 ,而 时 间 优 先 连 接 机 制 则 促成 对 最 新 知 
识 的 接受 和 知识 的 更 新 。 研 究 指出 , 度 择优 导致 了 科 
学 知识 网 络 中 马 太 效应 现象 的 出 现 , 虽 为 知识 学 习 提 
供 了 方便 但 妨碍 了 知识 的 更 新 换代 和 新 知识 的 脱 颖 而 
出 ,具有 全 局 性 的 影响 ;而 时 间 优 先 连接 则 具有 局 部 影 


Y 
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升 并 基于 交 秋 关系 聚集 成 更 大 的 知识 群落 。 祝 娜 和 王 
芳 " 从 主题 关联 的 角度 人手 ,以 3D 打印 领域 为 例 , 基 
于 LDA 识别 出 科技 创新 主题 并 进行 分 阶段 细 化 分 析 ， 
探测 主题 聚 类 内 部 与 外 部 的 关联 强度 。 研 究 结果 表 
明 ,在 知识 演化 路 径 各 阶段 ,新 主题 出 现时 必然 携带 新 
主题 词 出 现 ,而 一 些 主题 的 萎缩 消亡 必然 导致 相关 主 
题词 的 萎缩 消亡 。 

综 上 所 述 , 随 着 网 络 分 析 理 论 与 方法 的 日 渐 成 熟 ， 
以 网 络 思 维 对 各 类 知识 网 络 展开 研究 已 经 得 到 学 术 界 
的 普遍 认可 。 甚 中 关于 知识 网 络 聚 类 问题 的 相关 研究 
也 取得 了 较为 丰富 的 成 果 , 甚 至 近年 来 的 一 些 研究 工 
作 已 经 从 静态 分 析 发 展 到 动态 研究 。 然 而 ,在 领域 知 
识 的 发 展 进程 中 ,总 是 伴随 着 知识 的 生长 ,衰退 、 衍 生 、 
融合 等 现象 发 生 。 基 于 累计 数据 的 动态 分 析 ( 文 献 
[13] [10 -11] 等 ) 侧 重 于 对 前 序 状态 继承 的 生长 性 ， 
基于 发 生 值 的 分 析 ( 文 献 [8 -9] [12] 等 ) 则 聚焦 于 知 
识 演进 变迁 中 的 老化 与 创新 。 同 时 考虑 到 社会 化 标注 
系统 更 强 的 时 效 性 ,以 及 当前 学 术 界 对 基于 社会 化 标 
注 系 统 构 建 知识 网 络 的 认可 (文献 [8]、[11]、[13] 
等 )。 为 了 更 突出 地 捕 提 和 把 握 知识 发 展 进程 中 这 些 
变化 对 知识 聚 类 产生 的 影响 ,本 研究 基于 发 生 值 构建 
时 间 序列 标签 知识 网 络 , 从 随机 因素 、 度 相关 性 、 邻 近 
关联 3 个 视角 ,对 领域 知识 发 展演 进 过 程 中 的 聚 类 问 
题 展开 分 析 与 研究 。 


任何 一 个 学 科 领 域内 的 知识 单元 之 间 都 存在 一 定 
的 关联 性 ,这 种 知识 之 间 的 关联 关系 或 者 是 直接 关联 
或 者 是 间接 关联 ,从 而 使 学 科 领 域内 的 知识 单元 不 再 
离散 无 序 ,而 是 形成 一 定 程度 上 的 知识 聚 类 。 在 一 个 
学 科 领 域 发 展演 进 的 动态 过 程 中 ,新 生 的 知识 及 其 关 
联 关系 总 是 在 已 有 知识 与 知识 关联 的 基础 上 产生 的 。 
这 种 新 生 的 知识 与 知识 关联 更 加 突出 地 反映 该 学 科 领 
域 在 特定 时 期 内 的 知识 生长 衰落 、 衍 生 、 融 合 等 变化 。 
因此 ,研究 中 采用 领域 知识 当期 发 生 值 为 基础 数据 , 采 


响 的 后 发 优势 ,在 一 定 程度 上 平抑 度 择优 所 导致 的 马 
太 效 应 的 负面 影响 ,这 两 种 机 制 的 结合 形成 了 知识 演 
化 在 研究 基础 与 研究 前 沿 之 间 的 平衡 。 滕 广 青 ”从 
标签 间 的 关联 关系 出 发 对 领域 知识 网 络 中 紧密 型 知识 
凝聚 子 群 的 发 展 过 程 进行 时 间 序 列 的 动态 跟踪 与 分 
析 。 研 究 发 现 紧密 型 领域 知识 凝聚 子 群 数 量 的 波动 与 
凝聚 子 群 自身 的 扩张 、 衰 减 、 派 生 、 融 合 的 演化 过 程 有 
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j 网 络 分 析 的 思想 与 方法 ,对 领域 知识 动态 演进 过 程 
中 的 知识 聚 类 问题 展开 研究 。 

通常 来 讲 , 聚 类 实质 上 是 一 种 对 集合 内 的 研究 对 
象 进行 重新 分 类 的 过 程 , 在 知识 网 络 中 这 种 重新 分 类 
过 程 通常 体现 为 知识 凝聚 子 群 的 形成 。 而 领域 知识 在 
发 展演 进 过 程 中 ,知识 节点 及 其 关联 关系 随 着 时 间 的 
变化 而 不 断 改 变 , 使 得 领域 知识 在 时 间 序 列 上 不 断 出 
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AT, EA, 白 淑 春 , 等 . 领域 知识 聚 类 性 的 动态 演化 分 析 []]. 图 书 情 报 工作 ,2018 ,62(10) :85 - 93. 


现 分 化 与 聚合 的 现象 。 在 基于 发 生 值 的 知识 演化 分 析 
中 ,上 一 个 时 期 的 部 分 知识 节点 和 关联 关系 在 下 一 个 
时 期 被 隐 含 继承 的 同时 ,也 有 部 分 知识 节点 和 关联 关 
系 在 下 一 个 时 期 中 消退 潭 灭 ,同时 还 有 新 的 知识 节点 
和 关联 关系 在 下 一 个 时 期 中 新 生 。 对 于 领域 知识 发 展 
演进 的 过 程 而 言 ,这 是 一 种 微 规则 循环 往复 作用 的 体 
现 ,也 是 领域 知识 演化 迭代 的 发 展 过 程 。 网 络 分 析 能 
够 对 其 中 的 聚 类 现象 进行 量化 ,从 而 实现 针对 真实 知 
识 网 络 的 计算 与 测度 。 

研究 中 主要 依据 网 络 模 体 ( network. motif) 的 思想 
对 知识 网 络 的 聚 类 问题 展开 研究 。 网 络 模 体 是 网 络 的 
构成 单位 ,是 R，Milo ”研究 团队 在 他 们 发 表 于 《 科 
学 》( Science) 杂 志 的 关于 复杂 网 络 基本 构造 区 块 的 研 
簿 成 果 中 首先 提出 的 。 其 中 的 封闭 三 元 组 是 多 类 网 络 
模 体 中 最 适合 揭示 聚 类 关系 的 基本 构造 区 块 。 在 此 基 
础 的 ,进一步 采用 M. E. J Newman 推荐 的 聚 类 系 
义 : 网 络 中 所 有 长 度 为 2 的 路 径 中 闭合 路 径 所 占 
的 函 例 。 考 虑 到 研究 中 所 构建 的 为 无 向 知识 网 路 , 因 
此 选择 的 聚 类 系数 表达 公式 如 下 : 


公式 (1) 


OAR) 中 ,TC 为 封闭 三 元 组 ( 聚 类 视角 下 的 网 
RUK ,简称 聚 类 模 体 ) 数量 , 即 长 度 为 2 的 路 径 中 的 
闭 穿 路 径 数量 ;TP 为 连通 三 元 组 数量 , 即 所 有 长 度 为 2 
的 路 径 数量 ,包括 闭合 路 径 和 非 闭合 路 径 。 由 于 每 个 
封 亲 三 元 组 中 都 包含 3 个 连通 三 元 组 ,因此 系数 为 3。 
对 所 公式 (1) 的 具体 解析 如 图 ! 所 示 : 
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l 知识 网 络 聚 类 系数 解析 


图 1 中 ,(A) 为 长 度 为 2 的 路 径 ab<c ,节点 a 与 节 
点 e 拥有 一 个 共同 的 邻居 节点 b。 在 知识 网 络 中 通常 
也 被 理解 为 节点 a 与 节点 ce 有 一 个 共同 的 关联 知识 节 
点 b。 如 果 三 元 组 {a, b, c| 是 封闭 的 (节点 a 与 节点 c 
之 间 也 是 实 线 连接 ) ,那么 节点 a 与 节点 < 也 互 为 关联 
知识 。 因 此 M. E. J. Newman 的 聚 类 系数 可 以 理解 为 
知识 网 络 中 共同 与 某 一 知识 节点 直接 关联 的 两 个 知识 
节点 之 间 , 相 互 直 接 关 联 的 概率 , 即 三 点 形成 聚 类 模 体 
的 概率 。 也 可 以 等 价 理解 为 与 某 一 知识 节点 共同 关联 
的 两 个 知识 节点 ,本 身 也 直接 关联 的 平均 概率 。 图 1 


中 (B) (C) (D) 是 节点 数量 N = 10 , 连 线 数量 上 =20 
的 同等 规模 、 同 等 密度 的 网 络 。 其 中 (C ) 为 规则 网 络 ， 
由 于 (C) 中 并 不 存在 任何 封闭 三 元 组 ( 聚 类 模 体 ) ,其 
聚 类 系数 为 C =0。 另 外 ,(B) 为 同样 规模 与 密度 的 规 
则 网 络 ,(D) 为 同样 规模 与 密度 的 非 规则 网 络 。 由 于 
(B) 和 (D) 中 包含 一 定数 量 的 封 财 三 元 组 ( 聚 类 模 
体 ) ,因此 二 者 拥有 较 高 的 聚 类 系数 ,其 中 (B) 的 聚 类 
系数 恒定 与 网 络 规模 无 关 。 由 此 可 以 发 现 , 聚 类 系数 
与 知识 网 络 是 否 为 规则 网 络 无 关 , 其 中 起 到 关键 作用 
的 是 知识 节点 相互 之 间 具 备 直 接 关联 关系 的 聚 类 模 
体 , 即 封闭 三 元 组 。 


4 研究 方法 


4.1 研究 数据 

研究 中 ,以 社会 书签 和 出 版 物 共 享 网 站 Bibsonomy 
作为 基础 数据 源 展开 研究 。 领 域 知识 的 选择 范围 可 以 
是 庞大 的 学 科 领 域 ,也 可 以 是 精巧 的 主题 领域 ,甚至 是 
更 细小 的 问题 领域 。 由 于 近年 来 科学 技术 交叉 融合 的 
趋势 愈 发 明显 ,领域 知识 也 不 再 处 于 非 此 即 彼 的 完全 
割裂 状态 ,加 之 社会 书签 的 开放 性 ,许多 原本 似乎 隔离 
的 知识 通过 各 类 关联 关系 被 纳入 到 相关 的 领域 中 ,使 
得 研究 工作 能 够 获得 更 广泛 全 面 的 视野 。 本 研究 以 
“folksonomy "作为 目的 标签 ,采用 自主 研发 的 网 络 爬 虫 
工具 , 共 抓 取 该 领域 相关 文献 5 470 篇 ,时 间 跨 度 为 
2006 -2015 年 。 以 自然 年 度 作为 时 间 刻 度 进行 时 段 切 
H ,将 2006 -2015 时 间 区 间 划 分 为 10 个 时 间 窗 口 (0 , 
记 ,…, 旭 )。 对 各 个 时 间 窗 口中 的 领域 文献 及 其 对 应 
的 标签 进行 统计 ,获得 该 领域 各 个 时 间 窗 口 下 文献 与 
标签 的 相关 基础 数据 如 表 1 所 示 : 

R1 文献 与 标签 数量 的 时 间 序 列 分 布 


时 间 窗 口 文献 数量 (发 生 值 ) 标签 数量 (发 生 值 ) 
10 533 448 
u 865 901 
2 889 1010 
a 746 936 
4 625 862 
5 607 911 
16 349 690 
" 198 460 
i8 273 689 
9 385 736 


由 于 A-L. Barabasi 和 R. Albert 1$] 在 《科学 》( Sei- 
ence) 杂志 上 发 表 的 关于 网 络 标 度 涌现 的 文章 中 已 经 
阐明 "在 复杂 网 络 的 发 展 过 程 中 ,总 是 伴随 着 节点 的 加 
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和 .减少 甚至 是 消失 的 现象 ”, 同 时 考虑 到 本 研究 的 视 
角 主要 到 焦 于 领域 知识 演进 送 代 过 程 中 不 同时 期 知识 
来 类 的 演化 情况 ,因此 为 了 更 好 地 捕捉 领域 知识 在 生 
长 演变 过 程 中 知识 聚 类 的 新 生 与 衰落 现象 , 表 1 中 各 
个 时 间 窗 口 的 相关 指标 以 当期 发 生 值 作为 基础 数据 。 
4.2 ”领域 知识 网 络 构建 

基于 社会 化 标注 系统 构建 领域 知识 网 络 目前 已 经 
被 学 术 界 普遍 认可 和 接受 (参见 文献 [5] [8] [11]、 
[13] ) ,研究 中 将 根据 抓 取 的 数据 构建 领域 知识 网 络 。 
基于 表 1 中 的 当期 发 生 值 数据 构建 标签 邻接 和 矩阵 ,以 
标签 为 网 络 节点 ,标签 关联 关系 ( 同 现 关系 ) 为 网 络 连 
线 ,分 别 构建 0 ~ 09 时 间 窗 口 的 领域 知识 网 络 。 其 中 ， 
标签 邻接 矩阵 采用 二 值 矩阵 。 即 标签 A 与 标签 B 如 
果 具 备 同 现 关系 , 则 在 邻接 矩阵 中 记 为 1, 同 时 在 知识 
网 组 中 标签 A 与 标签 B 所 代表 的 知识 节点 之 间 由 连 
线 毅 接连 接 ; 若 标签 C 与 标签 D 不 具备 同 现 关系 , 则 
大 邻接 矩阵 中 记 为 0, 同 时 在 知识 网 络 中 标签 C 与 标 
竹马 所 代表 的 知识 节点 之 间 则 不 存在 直接 连 线 。 对 各 
分 旺 间 窗口 的 领域 知识 网 络 中 的 节点 与 连 线 数量 进行 

池 了 ,所 得 结果 如 表 2 所 示 : 

表 2 时 间 序 列 知识 网 络 节点 与 连 线 数 量 统计 


C 时 间 窗 口 节点 数量 连 线 数 量 
(0 448 2 899 
u 901 9 564 
2 1 010 7 129 
a 936 7 369 
d 862 5 069 
5 911 6 826 
i6 690 5 650 
" 460 2 905 
18 689 6 375 
9 736 6 359 


标 ,对 领域 知识 网 络 发 展演 进 中 的 知识 聚 类 问题 进行 
分 析 与 研究 。 按 照 不 同 的 时 间 窗 口 计算 提取 领域 知识 
网 络 的 聚 类 系数 。 基 于 上 文公 式 (1) 计 算 获 得 各 个 时 
间 窗 口 领域 知识 网 络 的 聚 类 系数 以 及 同等 规模 和 密度 
的 E-R 随机 网 络 的 聚 类 系数 如 表 3 所 示 : 

表 3 同等 规模 与 密度 的 领域 知识 网 络 


与 随机 网 络 聚 类 系数 
时 间 窗 口 Ck 网 络 密度 Cr 
10 0.292 0. 028 9 0.031 
u 0.498 0.023 6 0.024 
2 0. 193 0.014 0 0.015 
B 0. 283 0.016 8 0.016 
t4 0.181 0.013 7 0.014 
5 0.252 0.016 5 0.017 
16 0.425 0.023 7 0. 023 
这 0.415 0.027 5 0.027 
t8 0.56 0.026 9 0.026 
19 0.33 0.023 5 0. 024 


* 注 :Ck 为 知识 网 络 聚 类 系数 ,Cr 为 随机 网 络 聚 类 系数 


表 3 中 的 网 络 密度 参数 显示 出 10 — 09 时 间 窗 口 的 
领域 知识 网 络 密度 均 小 于 0.03。 网 络 密度 的 这 一 结 
果 反 映 出 ,研究 中 基于 真实 数据 构建 的 领域 知识 网 络 
与 目前 发 现 总 结 的 大 多 数 真 实 网 络 一 样 ,都 属于 一 定 
程度 的 稀 玻 网 络 。 聚 类 系数 则 反映 网 络 的 群 聚 程度 。 
表 3 中 知识 网 络 的 聚 类 系数 为 该 领域 当期 真实 数据 计 
算 所 得 ,随机 网 络 的 聚 类 系数 来 自 于 同等 规模 和 密度 
的 E-R 随机 网 络 ,用 于 研究 中 的 对 比 参照 。 表 3 中 知 
识 网 络 的 聚 类 系数 同样 不 具备 图 1 中 (C) 、(B) 规 则 网 
络 的 特征 ( 聚 类 系数 为 0 或 者 规模 无 关 性 ) 。 在 表 3 数 
据 的 基础 上 ,为 了 更 全 面 地 分 析 领 域 知 识 的 聚 类 演化 
状态 ,研究 中 还 将 辅助 以 知识 网 络 特征 路 径 长 度 、 封 闭 
三 元 组 数量 等 指标 以 及 经 典 的 统计 分 析 技 术 , 从 随机 


表 2 中 ,知识 网 络 的 节点 数量 即 为 标签 数量 ( 网 络 
节点 数量 = 当期 标签 数量 ) , 连 线 数量 即 为 标签 同 现 关 
系数 量 ( 相同 的 标签 同 现 关 系 不 重复 计数 )。 通 过 所 
构建 的 领域 知识 网 络 , 能 够 将 知识 节点 之 间 的 关联 关 
系 呈 现 出 来 ,并 且 从 结构 关系 的 视角 揭示 出 知识 聚 类 
情况 。 由 于 时 间 序 列 的 领域 知识 网 络 同 时 反映 了 领域 
知识 发 展演 化 的 进程 ,因此 基于 标签 和 标签 同 现 关系 
所 构建 的 各 个 时 间 窗 口 的 领域 知识 网 络 会 随 着 领域 知 
识 发 展 过 程 中 知识 及 其 关联 关系 的 繁荣 与 衰退 ,演化 
出 其 发 展 全 程 的 多 种 形态 。 

4.3 领域 知识 网 络 聚 类 系数 的 提取 
研究 中 采用 上 文 以 聚 类 模 体 为 基础 的 聚 类 系数 指 
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因素 . 度 相关 性 .邻近 关联 3 个 方面 对 领域 知识 演化 迭 
代 中 的 聚 类 演化 情况 展开 研究 。 


5 研究 结果 


5.1 领域 知识 聚 类 的 随机 因素 分 析 

从 研究 中 抓 取 的 原始 数据 ( 见 表 1) 来 看 ,由 于 各 
个 时 间 窗 口 的 数据 取 值 为 当期 的 发 生 值 ,因此 文献 数 
量 与 标签 数量 的 趋势 与 课题 组 此 前 的 研究 不 同 。 文 献 
数量 与 标签 数量 在 时 间 轴 的 延展 方向 上 并 非 是 逐 期 弟 
增 的 ,而 是 基于 当期 实际 发 生 数 存 在 高 低 起 伏 的 波动 。 
同时 结合 表 2 中 时 间 序 列 知识 网 络 的 相关 数据 可 以 发 
现 ,在 同一 时 间 窗 口 的 截面 下 ,知识 间 的 关联 关系 数量 


ChinaXiv 合 作 期 刊 


RT, 滕 广 青 , 白 淑 春 ,等 . 领域 知识 聚 类 性 的 动态 演化 分 析 []]. 图 书 情报 工作 ,2018 ,62(10) :85 -93. 


远 远 高 于 同期 的 知识 节点 数量 。 这 一 现象 在 反映 了 领 
域 知识 网 络 中 知识 之 间 的 关联 关系 远 比 知识 节点 的 数 
量 更 为 丰富 的 同时 ,也 从 当期 发 生 值 的 层面 佐证 了 领 
或 知识 发 展 过 程 中 知识 之 间 逻 辑 关系 的 重要 性 ,这 
也 是 动态 网 络 稠 化 (densification) "的 基础 。 

知识 之 间 的 逻辑 关系 在 知识 网 络 中 表现 为 网 络 连 
线 , 连 线 的 不 同 拓扑 结构 (封闭 .连通 等 ) 能 够 对 知识 
网 络 的 聚 类 系数 产生 影响 ( 见 公 式 (1) ) 。 由 于 表 3 中 
知识 网 络 聚 类 系数 计算 所 用 的 数据 集 不 包含 前 一 时 间 
窗口 数据 的 秋 加 ,因此 并 没有 取得 文献 [19] 中 那样 的 
跨越 整个 时 间 序列 的 极其 显著 的 高 位 性 。 但 是 其 取 值 
范围 与 M. E. J. Newman5 所 总 结 的 几 种 大 规模 知识 
网 络 的 聚 类 系数 的 取 值 范围 (0.088 — 0.45) 基本 相当 。 
同时 ,将 各 个 时 间 窗 口 的 领域 知识 网 络 的 聚 类 系数 与 
同等 规模 .相同 密度 的 E-R 随机 网 络 的 聚 类 系数 相 比 
知 , 真 实 知识 网 络 聚 类 系数 的 平均 水 平 高 出 随机 
聚 类 系数 平均 水 平 15.8 倍 , 即 领域 知识 网 络 的 聚 
数 远 高 于 E-R 随机 网 络 的 聚 类 系数 。 这 一 现象 反 
,基于 当期 发 生 值 真实 数据 构建 的 领域 知识 网 络 ， 
ATE BEOPLISI 4 tf E ,在 知识 演化 进程 中 仍然 保持 着 较 
领域 知识 群 聚 性 。 由 此 可 知 , 在 领域 知识 的 发 展 
浊 禹 中 ,知识 网 络 的 群 聚 情况 并 非 是 随机 网 络 一 样 的 
党 钨 随机 ,而 是 存在 着 一 定 程 度 的 非 随 机 因素 。 此 外 ， 
AAR 3 中 网 络 密度 的 数据 可 以 发 现 ,E-R 随机 网 络 
的 渠 类 系数 与 网 络 密度 之 间 具 有 显著 的 极 强 相关 性 
(PEARSON 相关 系数 Ree =0.986 8) ,而 真实 的 领域 知 
识 网 络 的 聚 类 系数 与 网 络 密度 之 间 的 相关 程度 则 明显 
IRB% (PEARSON 相关 系数 Rek 20.7323). 。 显 然 ， 
即使 真实 知识 网 络 与 随机 网 络 保持 了 相同 规模 与 相同 
密度 ,但 是 两 类 网 络 聚 类 系数 与 网 络 密度 相关 性 的 差 
异 却 进一步 说 明了 真实 知识 网 络 中 的 关联 关系 存在 一 
定 程度 的 结构 性 ( 非 随机 性 ) ,这 种 结构 性 因素 影响 网 
络 的 聚 类 系数 。 

为 了 进一步 检验 领域 知识 网 络 发 展演 化 过 程 中 影 
响 聚 类 系数 的 非 随机 因素 ,对 各 个 时 间 窗 口 的 领域 知 
识 网 络 的 特征 路 径 长 度 进行 计算 提取 。 所 获得 的 领域 
知识 网 络 的 特征 路 径 距 离 见 表 4。 

根据 表 4 中 各 个 时 间 序 窗口 下 领域 知识 网 络 中 距 
离 的 分 布 情况 可 以 发 现 ,在 整个 时 间 区 间 内 ,该 领域 知 
识 网 络 的 路 径 距 离 中 的 1 跳 距 离 和 4 跳 距 离 所 占 比例 
较 小 ,2 -3 跳 的 距离 占有 显著 的 高 比例 。 这 一 情况 说 
明 领 域 知识 网 络 中 任意 2 个 知识 节点 在 大 多 数 情况 下 
只 需要 2 -3 步 可 以 实现 连接 。 从 知识 网 络 全 局 范围 


lm 


zn 


表 4 时 间 序 列 领域 知识 网 络 的 特征 路 径 距 离 


TIR] 1 跳 距 离 2 跳 距 离 。 3 跳 距 离 4 跳 距离 平均 
窗口 (96) (96) (96) (96) 距离 
10 2.90 49.50 43.90 2.30 2.500 
u 2.40 49.40 47.80 0.40 2.463 
2 1.40 44.70 53.30 0.70 2.532 
a 1.70 46.20 50.80 1.30 2.518 
过 1.40 39.20 56.20 3.20 2.613 
5 1.60 41.50 54.20 2.40 2.581 
16 2.40 45. 80 49.20 2.60 2.521 
uU 2.80 37.80 52.70 6.70 2.633 
18 2.70 46.70 48.70 1.90 2.497 
19 2.40 46. 60 47.70 3.00 2.525 


上 来 看 ,领域 知识 网 络 的 平均 路 径 长 度 在 整个 时 间 区 
间 内 始终 保持 在 2.55 +0.1 范围 之 内 。 也 就 是 说 ,该 
领域 不 同时 期 知识 网 络 内 部 的 节点 之 间 平 均 只 需要 3 
步 的 距离 就 可 彼此 连通 。 结 合 此 前 领域 知识 网 络 的 聚 
类 系数 远 高 于 上 -R 随机 网 络 的 情况 可 以 说 明 , 较 高 的 
聚 类 系数 与 较 短 的 特征 路 径 长 度 符合 D. J. Watts 和 
S. H. Strogatz ”当年 在 (自然 》( Nature) 杂 志 上 提出 的 
判定 小 世界 网 络 的 标准 。 因 此 ,基于 当期 发 生 值 的 演 
化 进程 中 的 领域 知识 网 络 是 处 于 随机 网 络 和 规则 网 络 
之 间 的 小 世界 网 络 ,而 小 世界 网 络 独 有 的 关联 关系 特 
征 同时 包含 随机 性 与 非 随机 性 两 方面 的 因素 。 
5.2. 领域 知识 聚 类 的 度 相关 分 析 

随机 性 与 非 随 机 性 并 存 的 具有 小 世界 特征 的 领域 
知识 网 络 , 对 网 络 聚 类 系数 有 着 不 同 于 一 般 随机 网 络 
的 影响 。T.G. Lewis?" 在 对 小 世界 网 络 的 聚 类 系数 
的 研究 中 发 现 ,小 世界 网 络 的 节点 聚 类 系数 比 随 机 网 
络 和 无 标 度 网 络 要 高 ,并 且 倾 向 集中 于 具有 中 等 度 值 
的 节点 。 然 而 在 时 间 序 列 的 动态 演化 过 程 中 ,时 间 维 
度 的 加 入 使 得 领域 知识 网 络 聚 类 系数 的 演化 过 程 变 得 
更 为 复杂 。 研 究 中 将 表 3 中 的 知识 网 络 聚 类 系数 与 网 
络 节 点 的 度 值 结合 进行 分 析 。 以 网 络 中 知识 节点 的 聚 
类 系数 为 纵 轴 , 以 网 络 中 知识 节点 度 值 的 对 数 为 横 轴 ， 
得 到 反映 聚 类 系数 与 节点 度 值 关系 的 散 点 图 ,结果 见 
2, 

图 2 中 10 时 间 窗 口 领域 知识 网 络 对 应 的 散 点 图 
的 密集 中 心 (A 区 ) 位 于 中 等 偏 低 度 值 和 中 等 偏 高 了 类 
系数 的 位 置 。 这 一 特征 几乎 涵盖 了 时 间 序 列 的 整个 区 
间 (t 时 间 窗 口 表现 较 弱 ) ,其 中 ti 过 tt 9 
等 时 间 窗 口中 该 特征 表现 尤为 明显 。 这 一 现象 在 一 定 
程度 上 佐证 了 T.G. Lewis 在 实验 室 条 件 下 关于 小 
世界 网 络 聚 类 系数 分 布 的 研究 结论 。 与 此 同时 ，t0 时 
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图 2 领域 知识 网 络 的 节点 聚 类 系数 与 度 值 关系 
间 窗 口 散 点 图 顶部 的 最 大 聚 类 系数 的 点 组 成 的 近似 横 明 ,随机 网 络 中 的 聚 类 系数 是 由 邻近 网 络 的 特征 决定 


线 (B 区 ) 主 要 集中 于 中 等 偏 低 度 值 的 区 域 , 即 中 等 偏 
低 庶 值 的 知识 节点 有 机 会 具有 极 高 的 聚 类 系数 。 这 一 
现 钢 更 是 小 世界 网 络 的 节点 聚 类 系数 分 布 的 极端 表 
SER | 此 外 ,0 时 间 窗口 散 点 区 有 一 条 比较 鲜明 的 尾部 
(CX ) 处 于 高 度 值 和 低 聚 类 系数 的 区 域 ,这 一 情况 几 
FRET 0 ~ 9 整个 时 间 序列 。 同 时 ,0 ~ 9(15 除 


的 ,因此 有 必要 从 邻近 关联 的 角度 对 领域 知识 的 聚 类 
进一步 深入 分 析 。 在 网 络 的 拓扑 结构 中 , 聚 类 系数 通 
常 是 对 某 节点 的 邻居 节点 之 间 建 立 联系 的 概率 的 评 
估 。 由 于 上 聚 类 系数 是 目标 节点 的 两 个 邻居 节点 之 间 直 
接 关联 的 概率 , 即 节点 ALB 分 别 与 节点 C 直接 关联 的 
情况 下 ,节点 ALB 之 间 的 直接 关联 的 平均 概率 ,因此 
当 某 节点 的 两 个 邻居 节点 一 旦 也 具有 邻接 关系 (直接 
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大 加 近似 地 表明 了 高 度 值 节点 拥有 低 聚 类 系数 , 低 度 
储 漠 点 具有 较 高 了 类 系数 的 特征 。 这 一 现象 与 实验 室 
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.三 除 此 之 外 ,图 2 中 有 2 个 现象 需要 特殊 说 明 。 其 
一 时 间 窗 口 的 领域 知识 网 络 对 应 的 散 点 图 中 ,点 密 
集 区 的 右 侧 的 点 形成 一 条 近似 于 斜 线 的 分 布 (D 区 ) 。 
这 一 现象 在 Ht6 8 等 时 间 窗 口中 均 有 比较 明 
显 的 表现 。 这 一 现象 说 明 ,在 领域 知识 发 展演 进 过 程 
中 ,一 部 分 拥有 较 高 度 值 的 知识 节点 也 会 随 着 领域 知 
识 的 发 展 ,在 特定 时 期 呈现 出 高 低 不 同 的 聚 类 系数 。 
即 新 产生 的 知识 关联 在 一 定 程度 上 可 以 使 较 高 度 值 知 
识 节点 的 聚 类 系数 提高 。 其 二 ,65 时 间 窗 口 领域 知识 
网 络 对 应 的 散 点 分 布 相对 于 其 他 时 间 窗 口 更 为 离散 和 
随机 ,同时 散 点 图 顶部 最 大 聚 类 系数 的 点 组 成 的 近似 
横 线 延伸 跨度 最 长 (包括 低 度 值 区 域 . 中 等 度 值 区 域 和 
高 度 值 区域 ) 。 这 一 现象 说 明 领 域 知识 发 展演 进 过 程 
中 ,知识 聚 类 (有 序 ) 在 个 别 特定 时 期 仍然 可 能 会 表现 
出 较 强 的 随机 性 (无 序 ) 因素 。 

5.3 ”领域 知识 聚 类 的 邻近 关联 分 析 

鉴于 在 此 之 前 A，Fronczak 等 ”的 研究 已 经 证 
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关联 ) 时 , 则 形成 了 一 种 封闭 的 三 元 关系 ( 聚 类 模 体 ) 。 
从 这 个 意义 上 讲 , 可 以 理解 网 络 的 聚 类 系数 事实 上 是 
对 网 络 中 这 种 聚 类 模 体 的 度量 。 这 种 封闭 的 三 元 关系 
侧面 反映 了 表面 上 距离 为 2 的 节点 之 间 的 仅 通过 一 条 
连 线 就 可 相互 关联 。 结 合 表 4 中 对 于 领域 知识 网 络 中 
路 径 距 离 的 分 布 情况 可 以 看 出 ,网 络 中 2 ~3 跳 的 路 径 
占有 明显 的 高 比例 。 而 其 中 的 长 度 为 2 的 路 径 说 明 邻 
近 节 点 之 间 并 没有 形成 封闭 三 元 组 , 即 节 点 之 间 需 要 
2 跳 的 距离 才 可 以 相互 关联 ,也 说 明 长 度 为 2 的 路 径 
丰 实 上 是 对 网 络 知识 节点 聚 类 的 一 种 阻碍 力量 。 为 了 
更 细致 地 分 析 领 域 知 识 网 络 中 知识 节点 的 聚 类 演化 过 
程 ,进一步 对 领域 知识 网 络 中 知识 节点 所 形成 的 封闭 
三 元 组 数量 以 及 网 络 中 长 度 为 2 的 路 径 数量 进行 统 
计 , 其 结果 见 表 5。 

表 5 中 的 2 跳 路 径 为 领域 知识 网 络 中 尚未 形成 封 
闭 三 元 组 的 一 种 连通 三 元 组 。 根 据 时 间 序 列 下 领域 知 
识 网 络 中 封闭 三 元 组 2 跳 路 径 数量 的 统计 结果 ,同时 
对 照 表 3 中 领域 知识 网 络 聚 类 系数 的 统计 结果 可 以 发 
现 , 领 域 知识 网 络 的 封闭 三 元 组 数量 与 2 跳 路 径 数量 
的 比值 (TCA(TP-TC) ) 和 网 络 聚 类 系数 之 间 存 在 较 强 
的 相关 性 ,PEARSON 相关 系数 Rer 20.973 9。 由 于 基 
于 真实 数据 的 领域 知识 网 络 不 可 能 具备 实验 室 条 件 下 
网 络 规模 不 变 等 假设 前 提 , 因此 不 能 简单 地 得 出 聚 类 
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表 5 时间 序列 封闭 三 元 组 与 2 跳 路 径 


时 间 窗 口 TC TP-TC TC/( TP-TC) 
t0 11 224 49 607 0.226 
tl 112 232 198 496 0.565 
t2 31 020 227 578 0.136 
a 44 012 202 172 0.218 
u 15 863 145 538 0.109 
t5 32 918 171 993 0.191 
t6 40 378 108 879 0.371 
Uu 12 683 39 401 0.322 
t8 69 014 109 487 0.630 
t9 38 006 126 024 0.302 


* 注 :TC- 封 闭 三 元 组 数量 ,TP- 连 通 三 元 组 数量 ,TP-TC2 跳 路 径 
数量 
系数 与 封闭 三 元 组 呈正 相关 ,或 者 与 2 MKE HA 
关 价 结论 。 结 合 上 文公 式 (1) 可 以 将 这 种 相关 性 总 结 
寺 闭 三 元 组 数量 与 2 跳 路 径 数量 之 间 的 比值 在 很 
得 度 上 决定 了 网 络 聚 类 系数 的 变化 趋势 。 
加 在 分 析 过 程 中 ,进一步 选取 该 领域 中 具体 的 知识 
节 二 作 为 分 析 对 象 ,在 局 部 细节 层面 上 对 领域 知识 网 
ARRIUS D ROSE SERIE iS RR. rir 
取 “ontology” 知 识 节点 展开 局 部 聚 类 演化 过 程 的 跟 


C 


踪 写 分 析 ,统计 该 知识 节点 的 聚 类 系数 .包含 该 知识 节 


CNI 


; 封闭 三 元 组 、 以 该 知识 节点 为 中 介 的 2 跳 路 径 数 
= 及 封闭 三 元 组 与 2 跳 路 径 数量 的 比值 。 相 关 结 
FK 6 所 示 : 


FE “ontology” 的 节点 聚 类 系数 .封闭 三 元 组 及 2 跳 路 径 
富国 窗口 Cn TC TP-TC TC/( TP-TC) 
FI 0. 198 2043 1937 1.055 
m 0.302 86226 9673 8.914 

2 0. 129 3604 5315 0.678 

a 0.205 1248 1269 0.983 

" 0.216 1580 1341 1.178 

5 0.251 5234 2367 2.211 

16 0.357 1790 581 3.081 

07 1 1 0 T 

n 1 84 0 i 

9 0.278 1246 814 1.531 


* 注 :Cn- 节 点 聚 类 系数 ,TC -封闭 三 元 组 数量 ,TP- 连 通 三 元 组 数 
量 ,TP-TC2 跳 路 径 数量 

从 表 6 中 的 数据 可 以 看 出 ,在 领域 知识 发 展 进程 
中 ,“ontology” 知 识 节点 周围 的 聚 类 情况 并 不 是 固定 不 
变 的 。 围 绕 该 知识 节点 的 封闭 三 元 组 数量 以 及 2 跳 路 
径 数 量 都 会 随 着 领域 知识 的 演进 产生 一 定 的 变化 ,并 
且 二 者 的 变化 走向 大 致 相同 。 这 反映 了 在 领域 知识 的 


发 展演 进 过 程 中 , 随 着 知识 关联 关系 老化 与 新 生 的 不 
断 更 迭 ,知识 节点 周围 在 大 多 数 情 况 下 会 有 新 的 代表 
非 直接 关联 的 2 跳 路 径 产 生 , 同 时 也 形成 大 量 直 接 关 
联 的 封闭 三 元 组 关系 。 总 体 而 言 , 表 5 和 表 6 的 结果 
都 反映 了 通常 情况 下 ,封闭 三 元 组 ( 聚 类 模 体 ) 与 2 跳 
路 径 (通过 长 度 为 2 的 路 径 关 联 ) 的 比值 越 高 ,该 知识 
节点 的 聚 类 系数 往往 越 高 。 其 中 习 as 时间 窗口 2 SE 
路 径 数量 为 0, 说 明 该 阶段 ”ontology ”的 邻居 节点 中 不 
存在 无 法 直接 关联 的 知识 节点 ,表现 出 “ontology ”领域 
知识 发 展演 化 进程 中 的 阶段 性 稳定 与 成 熟 。 

然而 ,作为 复杂 系统 演化 的 知识 网 络 发 展 还 有 其 
特殊 的 一 面 。 众 多 的 连通 三 元 组 (包括 封闭 三 元 组 和 
2 跳 路 径 ) 也 只 是 有 利于 促成 节点 在 网 络 中 的 高 hub 
(高 度 值 ) 地 位 。 在 某 些 情况 下 ,即使 封闭 三 元 组 与 2 
跳 路 径 数量 具有 较 高 的 比例 ,也 并 非 就 一 定 能 够 完全 
决定 以 该 知识 节点 为 中 心 的 聚 类 系数 的 高 位 性 。 表 6 
rp u 时间 窗口 “ontology” 知 识 节 点 的 封闭 三 元 组 数量 
远 多 于 2 中 路径 数量 且 二 者 比值 很 高 (比例 =8.914 ) , 
但 是 其 众多 的 2 跳 路 径 数 量 还 是 在 一 定 程度 上 制约 了 
tl FEJA O F “ontology” 知识 节点 的 聚 类 系数 的 高 位 
性 。 因 此 ,严格 地 说 ,相对 于 个 体 节 点 的 2 跳 路 径 而 言 
( 非 直接 关联 ) ,封闭 三 元 组 ( 聚 类 模 体 ) 仅仅 是 高 聚 类 
系数 的 必要 条 件 而 非 充 分 条 件 。 


6 ”结论 与 讨论 


本 研究 基于 社会 化 标注 系统 中 标签 同 现 关系 构建 
时 间 序 列 领域 知识 网 络 ,探索 领域 知识 演进 过 程 中 知 
识 聚 类 的 状态 与 相关 影响 因素 。 通 过 对 时 间 序 列 领域 
知识 网 络 的 随机 因素 、 度 相关 性 、 邻 近 关 联 等 方面 的 跟 
踪 分 析 ,揭示 领域 知识 演进 过 程 中 知识 聚 类 的 演化 模 
式 及 其 背后 的 影响 因素 。 综 合 上 述 对 领域 知识 演进 过 
程 的 时 间 序 列 动态 跟踪 与 分 析 , 初 步 可 以 得 出 以 下 结 
论 。 

(1) 在 领域 知识 的 生长 发 展 过 程 中 ,领域 知识 始 
终 保持 较 高 的 聚 类 性 。 从 表 3 中 知识 网 络 的 密度 可 以 
发 现 ,基于 真实 的 当期 发 生 值 构 建 的 领域 知识 网 络 是 
一 种 稀 玻 网 络 。 但 是 与 同样 密度 .同等 规模 的 稀 琉 的 
随机 网 络 相 比 ,领域 知识 网 络 的 聚 类 系数 明显 高 于 随 
机 网 络 。 并 且 这 种 较 高 的 聚 类 状态 在 整个 演进 周期 内 
保持 。 尽 管 研 究 中 使 用 的 真实 数据 与 D. J. Watts 
等 ”在 实验 室 条 件 下 使 用 的 仿真 数据 不 同 ,但 是 却 从 
知识 聚 类 的 层面 同样 验证 了 知识 网 络 与 完全 规则 网 络 
和 随机 网 络 的 差异 。 即 基于 真实 当期 发 生 值 构建 的 领 
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域 知 识 网 络 ,在 知识 演进 过 程 中 始终 保持 较 高 的 聚 类 
性 。 


(2) 领域 知识 的 聚 类 性 同时 包含 随机 性 与 结构 性 
( 非 随机 性 ) 两 方面 因素 。 现 实 中 的 科学 研究 总 是 建 
立 在 前 人 研究 工作 的 基础 上 ,后 续 时 间 窗 口 当 期 发 生 
值 表现 出 的 知识 关联 显然 也 经 过 潜移默化 的 更 新 和 选 
代 , 相 当 于 一 定 程度 上 的 网 络 重 连 。 加 之 领域 知识 网 
络 在 演进 过 程 中 表现 出 的 较 高 的 聚 类 性 ( 见 表 3) ,以 
及 PEARSON 相关 系数 由 极 强 相关 (0.8 -1.0) 到 一 般 
强 相 关 (0.6 -0.8) 的 落差 (Rce = 0. 986 8, Rek = 
0.732 3) ,其 中 的 结构 性 ( 非 随机 性 ) 因素 也 被 凸显 出 
来 。 同 时 ,尽管 在 大 多 数 时 刻 结构 性 ( 非 随机 性 ) 因素 
表现 显著 ,但 是 随机 因素 并 没有 完全 泥 灭 。 图 2 t5 
时 间 和 窗口 的 散 点 分 布 的 离散 状态 就 表现 出 较 强 的 随机 
字 因 此 ,动态 演进 过 程 中 的 领域 知识 的 聚 类 性 ,同时 


本田 网 络 之 间 摇 所 演化 。 较 高 的 聚 类 系数 ( 见 表 3) 和 


较 姑 的 特征 路 径 长 度 ( 见 表 4) 表 明 , 基 于 真实 数据 发 
能 三 构 建 的 领域 知识 网 络 是 一 种 小 世界 网 络 。 同 时 ， 
高 聚 类 系数 主要 集中 于 中 等 偏 低 度 值 区 域 ( 见 图 2 中 
ATD B 区 ) 的 现象 也 进一步 体现 出 领域 知识 的 聚 类 状 
巷 逢 合 小 世界 网 络 的 特征 。 然 而 在 度 相关 分 析 中 还 可 
以 恬 现 ,在 时 间 序 列 的 众多 窗口 中 , 散 点 分 布 旦 现 出 的 
避 同 明显 程度 的 尾部 (如 10 时 间 窗 口 散 点 图 右 下 角 的 
c 这) 。 这 一 现象 说 明 , 领 域 知识 发 展演 进 过 程 中 , 知 
识 的 聚 类 状态 同时 还 表现 出 无 标 度 网 络 的 特征 。 演 进 
过 福 中 不 同 散 点 区 域 的 不 同 显著 程度 进一步 反映 了 知 
识 聚 类 状态 在 小 世界 网 络 和 无 标 度 网 络 之 间 播 摆 演 
化 。 

(4) 领 域 知识 的 聚 类 状态 在 空间 维度 (全 局 与 局 
部 ) 内 也 表现 出 一 定 的 差异 性 。 通 过 时 间 序列 分 析 , 领 
域 知 识 聚 类 状态 在 时 间 维度 上 的 差异 已 经 跃然 纸 上 。 
在 空间 维度 方面 ,就 领域 知识 全 局 ( 知识 网 络 全 局 ) 而 
言 , 网 络 聚 类 系数 与 封闭 三 元 组 和 2 跳 路 径 数量 的 比 
值 呈正 相关 (Rer =0.973 9) 。 然 而 局 部 个 体 节点 的 聚 
类 系数 在 总 体 趋势 上 保持 上 述 正 相关 关系 的 同时 ,也 
在 其 中 个 别 时 刻 旦 现 出 一 定 的 差异 性 。 表 6 ru 时 
间 窗 口 的 高 比值 并 没有 获得 极其 显著 的 高 聚 类 。 显 
然 ,对 于 局 部 聚 类 系数 而 言 ,这 种 正 相关 关系 并 非 是 绝 
对 严格 的 。 从 统计 学 意义 上 来 讲 , 这 也 是 样本 均值 与 
样本 个 体 之 间 差异 的 体现 , 即 全 局 知识 聚 类 与 局 部 知 
识 聚 类 之 间 的 差异 。 
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本 研究 专门 针对 领域 知识 的 当期 发 生 值 对 知识 聚 
类 情况 展开 时 间 序 列 研究 ,基于 发 生 值 内 含 的 知识 衰 
老 与 新 生 ,发 现 和 揭示 领域 知识 聚 类 状态 与 特征 的 演 
化 规律 。 发 生 值 与 累计 值 相 比 ,能 够 更 好 地 捕捉 和 体 
现 知识 的 老化 与 创新 对 领域 知识 聚 类 产生 的 影响 。 现 
实 社 会 中 的 社交 网 络 .信息 传播 网 络 等 大 多 数 真实 网 
络 都 会 面临 友谊 关系 断绝 或 结交 传播 渠道 阻塞 或 新 
建 等 问题 。 因 此 研究 中 发 现 的 聚 类 特征 与 规律 ,借助 
其 对 累计 值 数据 中 关联 或 连接 关系 不 消除 假设 的 解 
除 ,也 有 同样 助 于 社交 网 络 \ 信 息 传播 网 络 等 具有 衰退 
和 新 生 因素 的 网 络 的 聚 类 特征 的 揭示 。 研 究 中 的 局 限 
主要 在 于 发 生 值 相对 于 累计 值 而 言 具 有 更 大 的 跳跃 
性 ,在 对 前 序 状态 的 继承 性 方面 体现 得 不 如 累计 值 显 
著 。 在 未 来 的 研究 中 ,将 采取 更 兼顾 平滑 与 跳跃 的 视 
ff ,将 累计 值 与 发 生 值 相 结合 展开 研究 ,以 期 更 全 面 准 
确 地 对 领域 知识 发 展演 化 进程 中 的 模式 与 规律 进行 探 
索 与 揭示 。 
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NApstract: [ Purpose/significance | Exploring the clustering evolution in the process of domain knowledge develop- 
ment can help to reveal the characteristics and rules of knowledge clustering, this is great significance to master the cluste- 
ring rules of correlation knowledge in the development and evolution process. [ Method/process | Based on the idea of 
coltigllex network, this paper constructed the time series domain knowledge networks in accordance with the occurred -value 
of mA adjacency relation. That is, according to the network motif theory, this paper dynamically tracked and analyzed the 
dagin knowledge networks by the analysis method of network clustering coefficient. Then, by combining with the network 
density, the characteristic path length, the node degree value, the triadic closure and other indicators, this article ana- 
lyzed the clustering evolution in the process of domain knowledge development from random factors, degree correlation , 
and adjacent correlation. | Result/ conclusion | The results show: @)Domain knowledge in the development process always 
keeps a higher clustering. (2)The clustering of domain knowledge includes both randomness and structuration ( non -ran- 
domness). (3)The dynamic status of domain knowledge clustering evolves between small-world network and scale-free net- 
work waveringly. (4)The clustering status of domain knowledge shows a certain difference between the whole network and 
local nodes. 
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